Day3—生成式AI的概念以及歷史

2024 iThome 鐵人賽

DAY 3

生成式 AI

從零開始學-生成式AI系列第 3 篇

16th鐵人賽

rick1108

2024-09-17 12:22:33

473 瀏覽

分享至

生成式AI是一類能夠生成新內容（如文字、圖像、音頻等）的人工智慧模型。它能夠辨別傳統數據，還能創造新數據，這與傳統的判別模型（如分類模型）有很大區別。
常見的生成式模型：
簡單來說
GPT（生成預訓練變換器）：可以生成自然語言文本，用於對話、故事創作等。
在現代是不可或缺的，能在很短的時間內，處理大量的文字內容，也可以產出有基本運行功能的程式碼，就像某些人說的一樣，現在正在進入no code的時代。其速度及可運作的規模之大，我可能需要好幾個小時來研究、撰寫，它可能幾秒就能完成。

GPT 如何運作？
雖然將 GPT 模型描述為人工智慧 (AI) 是準確的，但這是一個廣泛的描述。更具體來說，GPT 模型是在轉換程式架構上建置的神經網路型語言預測模型。這些模型可分析自然語言查詢 (稱為提示)，並根據對語言的理解預測最佳回應。
為此，GPT 模型依賴於在大量語言資料集上，使用數千億個參數進行訓練後獲得的知識。他們可以考慮輸入內容並動態處理輸入的不同部分，使其能夠產生較常的回應，而不僅僅是序列中的下一個單詞。例如，要求產生一段莎士比亞風格的內容時，GPT 模型會記住並重新建構具有類似文學風格的新片語和整個句子，藉此來實現這一目標。
有不同類型的神經網路，如遞歸和卷積。GPT 模型是轉換程式神經網路。轉換程式神經網路架構使用自我專注機制，在每個處理步驟中專注於輸入文字的不同部分。轉換程式模型會擷取更多內容，並改善自然語言處理 (NLP) 任務的效能。（從網站理解

GAN（生成對抗網絡）：擅長生成逼真的圖像、影片等。
在網站的範例中能看到它對圖像的分解、補全、創作的能力，它有多種類型去匹配要使用的領域，

生成式對抗網路 (GAN) 是一種深度學習架構。它訓練兩個神經網路來彼此競爭，從指定的訓練資料集中產生更真實的新資料。例如，您可以從現有的影像資料庫中產生新影像，或從歌曲資料庫中產生原始音樂。GAN 之所以被認為具有對抗性，是因為它可以訓練兩個不同的網路並使它們相互對抗。一個網路採取輸入資料範例，並儘可能多地修改來產生新資料。另一個網路會嘗試預測產生的資料輸出是否屬於原始資料集。換言之，預測網路確定產生的資料是虛假還是真實。系統會產生較新的改進版假資料值，直至預測網路無法再區分虛假資料與原始資料。
生成式對抗網路如何運作？
生成式對抗網路系統包括兩個深度神經網路 — 產生器網路和鑑別器網路。
這兩個網路在對抗性遊戲中訓練模型，其中一個網路嘗試產生新資料，另一個網路嘗試預測輸出是虛假資料還是真實資料。
從技術上講，GAN 的運作方式如下。複雜的數學方程式構成整個運算程序的基礎，以下是其簡單的概述：
產生器神經網絡神經網路分析訓練集並識別資料屬性
鑑別器神經網路分析初始訓練資料並獨立區分屬性
產生器透過向某些屬性新增雜訊 (或隨機變化) 來修改某些資料屬性
產生器將修改的資料傳遞給鑑別器
鑑別器計算產生輸出屬於原始資料集的概率
鑑別器為產生器提供一些指導，以減少下一個週期中雜訊向量隨機化
產生器嘗試最大限度提高鑑別器發生錯誤的概率，而鑑別器嘗試將錯誤的可能性降到最低。
在訓練反覆運算中，產生器和鑑別器會不斷演變並相互對抗，直到它們達到平衡狀態。在平衡狀態下，鑑別器無法再辨識合成資料。至此，培訓程序結束。（網站

生成式AI（Generative AI）的歷史可以追溯到人工智能的早期發展，但其真正的發展是在近年來深度學習技術進步的基礎上實現的。以下是生成式AI歷史的一些重要里程碑：

1. 早期生成技術與AI基礎

1950-60年代：在這一時期，計算機科學家開始研究如何讓計算機模仿人類的創造力。艾倫·圖靈提出的圖靈測試也為未來的AI研究奠定了理論基礎。
1970年代：早期的生成技術包括一些簡單的規則系統和隨機生成方法，比如用來創造詩歌或音樂的算法，但這些方法非常有限。

2. 生成模型的引入

1980年代：研究人員開始探索如何通過機器學習來生成內容。反向傳播算法（Backpropagation）的發現推動了神經網絡的發展，雖然當時的技術受限，但為日後的突破打下了基礎。

3. 深度學習時代的到來

2010年代初：隨著計算能力的提高，特別是GPU（圖形處理單元）的進步，深度學習模型得以蓬勃發展。這時期，卷積神經網絡（CNN）和遞歸神經網絡（RNN）得到了廣泛應用，特別是在圖像生成和語言處理領域。

4. 生成對抗網絡（GANs）的誕生

2014年：伊恩·古德費羅（Ian Goodfellow）和他的同事提出了生成對抗網絡（GANs）的概念，這是一種使用兩個神經網絡相互競爭的模型，一個生成數據，另一個則試圖區分真假數據。GANs在生成圖像和視頻等方面取得了驚人的效果，成為生成式AI的重大突破。

5. 自回歸模型與自然語言生成

2018年：OpenAI推出了GPT（Generative Pre-trained Transformer）模型，它是一種基於Transformer架構的自回歸模型，專注於自然語言的生成和理解。GPT系列模型的發展，特別是GPT-3，在生成文本的流暢度和上下文理解上達到了前所未有的高度，使得生成式AI在文字創作、對話生成等方面得到了大規模應用。